
视频生成1.3B碾压14B、图像生成直逼GPT-4o!港科&快手开源测试时扩展新范式
视频生成1.3B碾压14B、图像生成直逼GPT-4o!港科&快手开源测试时扩展新范式测试时扩展(Test-Time Scaling)极大提升了大语言模型的性能,涌现出了如 OpenAI o 系列模型和 DeepSeek R1 等众多爆款。那么,什么是视觉领域的 test-time scaling?又该如何定义?
测试时扩展(Test-Time Scaling)极大提升了大语言模型的性能,涌现出了如 OpenAI o 系列模型和 DeepSeek R1 等众多爆款。那么,什么是视觉领域的 test-time scaling?又该如何定义?
一个先相信、后看见的 AI 创业者。
近日, Mastra AI 创始人 Sam Bhagwat 在 X 上发布了一条推文,称其中提到大约 60~70% 的 YC X25 Agent 公司正在使用 TypeScript 构建他们的 AI Agent。
你有没有想过,那些电视台、制作公司里堆积如山的视频素材,可能马上就要被彻底重新定义了?想象一下,从数千小时的视频内容中找到你需要的那一个镜头,不再需要安排一群人没日没夜地看片子、做标记,而是只需要简单描述一句"奥巴马谈论人权的片段",系统就能立刻定位到精确的时间点,并提供详细的场景描述、人物信息和镜头分析。
知识库成为大模型落地的热门场景,现实中却走入了 “技术炫酷却用不起来” 的窘境。
AnySphere 联合创始人兼 CEO Michael Truell 所构建的 Cursor,不仅是当前增长最快的 AI 编程产品之一,更是未来“后代码时代”的早期形态。
6 月 9 日消息,据外媒TechXplore 报道,由 AI 视频技术公司 Runway 主办的年度 AI 电影节于 6 月 5 日在纽约拉开帷幕,全球十部短片首次登上大银幕亮相。Runway CEO 克里斯托瓦尔・巴伦苏埃拉说:“三年前这听起来还是天方夜谭。现在,全球已有数百万人使用我们当年仅是梦想的工具,创作出数十亿条视频。”
3D生成模型高光时刻来临!DreamTech联手南大、复旦、牛津发布的Direct3D-S2登顶HuggingFace热榜。仅用8块GPU训练,效果超闭源模型,直指影视级精细度。
前天,生财有术的老板亦仁发布了一条「超级标」(至少价值千万以上的现象级行业机会): 随着GPT-4o图像革命而来的,是无数的创业机会。
Scale AI 即将获得 Meta 高达数十亿美元的投资,金额可能超过 100 亿美元,这将成为有史以来规模最大的私营企业融资事件之一。